面板数据聚类, 因子分析和主成分分析咋做?
凡是搞计量经济的,都关注这个号了
Mail:econometrics666@sina.cn
所有计量经济圈方法论丛的程序文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
一些发表Top期刊的独特数据,受到圈友强烈推荐。
感谢群友 @软软草 供稿
之前,这里有讲过面板数据模型操作指南, 不得不看的16篇文章和聚类分析(Cluster Analysis)及操作过程,但是还没有讲过将两者结合起来的Panel data clustering analysis。
以下这篇文章是讲多指标的面板数据聚类问题,即咱们需要在考虑很多指标的基础上对各个个体进行聚类。文章的做法是这样的,先得到按照时间对各个体所对应的指标数据求均值,这样就可以构建一个某个时间点该指标所对应的均值,比如2019年A指标的均值,2020年A指标的均值..
下面这篇文章开展多指标面板数据中的因子分析,与上面的聚类分析类似,也是先把三维度的数据信息通过处理转化为二维度的信息。
这种方法的缺陷以下文字讲得比较清楚,因此也需要有取舍地使用。
关于其他多元分析方法及操作,强烈建议圈友收藏阅读以下文章:
以上方式在多元分析中的应用比较多,但毛病也不少,毕竟损失了不少信息,因此后续的研究工作还在不断开展。可以有选择性的参考以下文献:
2年,计量经济圈公众号近1000篇文章,
Econometric Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光
计量系列:匹配方法 | 内生性问题 | 工具变量 | DID | 面板数据 | 常用TOOL
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,坚信优秀始终是通过感染优秀而互相成就彼此的。